SIMD相关论文
基于ARM Cortex-A53处理器平台,对NEON协处理器的指令和编程优化方法等技术进行了分析,并以此平台进行了D2C(Depth to Color)算法......
随着计算机相关产业的飞速发展,特别是移动互联网的出现,计算机所要处理的数据不仅在规模上越来庞大,在结构上也越来越复杂。大数......
随着大数据和云计算应用的普及,对于海量数据处理能力的需求越来越高。用于大规模数据处理的数据密集型算法是以I/O访存和数据处理......
作为基本的数学运算,三角函数的高性能实现对构建处理器的基础软件生态具有重要意义,特别是当前处理器都采用了SIMD架构,基于SIMD......
本文首先介绍了两款由不同厂家推出的DSP芯片的体系结构,重点比较其异同;紧接着结构的讨论,又将它们针对同一视频编码器的原码进行......
基于CSIM仿真软件包设计与实现了一种能对SIMD结构计算机进行性能评价的仿真器.重点阐述了SIMD虚拟机的建模过程,并介绍了仿真器的......
本文介绍集成在Mini PACS中的虚拟内窥镜模块涉及的关键技术,阐述了虚拟内窥镜的导航原理、成像算法和加速技术.导航包括自动导航......
本文介绍了数字区域空间信息管理与分发系统的开发背景、系统的业务流程和设计遵循的原则,并分析了该系统包含的测试成果登记子系......
This paper proposes a flexible eight-mode high parallel Galois SIMD ASIP(Application Specific Instruction Set Processor)......
本文结合作者在MHARC和TigerSHARC软件开发过程中积累的经验,阐述了如何使用指令并行和SIMD来获得最佳的代码执行效率.文中提供有......
会议
首先,结合Intel、AMD 和IBM 处理器,介绍了SIMD 向量化技术,以及各自特点.其次,在三种平台上对各自开发的函数库中的部分向量数学......
序列密码算法ZUC-128是3GPP机密性算法EEA3和完整性算法EIA3的核心. ZUC-256算法是ZUC-128的升级版本,以应对5G通信安全性需要和后......
ZUC算法,即ZUC-128流密码算法,是首个成为国际商业密码标准的国产密码算法.目前,ZUC-128算法和后续ZUC-256算法的硬件优化工作卓有......
<正> Ⅰ. INTRODUCTION Let us first consider the process in which N hadrons are produced such as a+b→1+2…+m+…+N. (1) K......
The evolution of chip architecture is discussed in this paper. Then MPP SoC architectures according to three kinds of co......
An instruction level parallel computing paradigm and a unified architecture for an array processor(AP) on a chip(SoC) ar......
重度脓毒症和脓毒性休克已成为ICU患者的主要死因,约40%的脓毒症患者合并有心肌功能障碍(Sepsis-induced myocardial dysfunction,......
H.264/AVC是由ITU-T和MPEG共同制定的最新的视频编码标准.与现有标准相比,H.264获得了更高的压缩性能,同时具有更好的网络适应性.......
多媒体应用是近年来计算机领域的研究热点。多媒体应用的代码往往具有较高的并行度。为了获得更高的性能,几乎所有的处理器厂商都......
随着视频压缩编码技术和网络技术的不断发展,基于网络传输的视频得到了广泛的应用。长期以来,我国在数字音视频产业发展方面一直受......
该论文对虚拟内窥镜中的关键技术做了比较深入细致的研究,主要包括成像算法的加速和系统导航功能.成像速度是影响虚拟内窥镜技术推......
智能交通系统(ITS)是新一代的交通管理系统,它包括交通流量检测、车辆识别、交通异常事件检测等方面,车辆的实时检测算法是基于视......
该文提出了两种SIMD自动优化方法,基于向量化的方法和基于模式匹配的方法.这两种方法都可以自动生成SIMD指令,对某些多媒体程序取......
医学图像三维可视化技术是当前可视化研究的重点,也是实践中最常遇到的。直接体绘制技术是可视化中一类重要的技术。与从数据场中抽......
随着计算机技术和互联网技术的发展,信息检索已经成为一项重要的技术,在各个领域都有着广泛的应用。因此,对信息检索进行硬件加速以提......
数字信号处理器是面向数字信号处理的专用处理器,其结构与面向的应用特点息息相关。运用VLIW超长指令字的处理器体系结构,能够使得......
视频是重要的数字信息载体,视频传输已经渗透到我们生活的方方面面。随着视频内容增长和视频产业的迅速发展,4K视频和3D视频逐渐走......
近年来,数据挖掘已发展为学术界和业界研究的关键领域,以社交网络和文献引用等关系为代表的稀疏图结构数据挖掘是重要分支。随着大......
随着数字信号处理器(DSP)应用的不断扩展,如何提高DSP的运算性能面临着新的挑战。SIMD架构能充分发掘应用的数据级并行,以较低的硬......
随着CFD应用的推广,以DG为代表的高阶数值方法得到广泛应用,对欧拉方程的RKDG显式求解是其中一个重要的应用分支。HopeFOAM是一个......
随着互联网视频业务的快速发展,网络传输带宽面临越来越大的压力,市场对于压缩效率更高的视频编码标准的需求也愈发迫切。HEVC和AV......
基于ARM高性能处理器的SoCs是移动计算的主要平台,也是下一代高性能计算系统(HPC)的候选平台。ARM架构为满足新的需求而不断更新,......
随着第五代移动通信(5G,5th Generation Mobile Communication)标准的制定,移动通信逐渐迈入5G时代。5G引入了较多的新技术,包括低......
DSP 在手机、音乐播放器和其他消费品中的应用,直接关系着系统的功能与价格。在适当的价位上,DSP 必需提供足够的功能满足当前需求......
文章介绍了一种新的嵌入式SIMD协处理器地址产生器。该地址产生器主要完成地址计算和协处理器指令的场抽取功能。为了提高协处理器......
在信号处理领域的优异表现使得Vector-SIMD结构在近年来获得了广泛的关注.Vector-SIMD结构和多核技术相结合是目前高性能DSP体系结......
Energy efficiency is one of the most important issues for High Performance Computing(HPC) today.Heterogeneous HPC platfo......
介绍了64位环境下SIMD技术的基本原理,实现了通信领域的解复用过程并用SIMD技术对其进行了优化。
The basic principle of SIMD t......
CELL BE处理器包括一个基于PowerPC架构的控制处理单元Power Processing Element(PPE)以及8个SIMD的协处理器单元——Synergis- ti......
This paper presents a novel compact memory in the processing element(PE) for single-instruction multiple-data(SIMD) visi......
现在的电脑革命,实际上是个操作感觉上的革命,大家所追求的无非是:电脑运行速度越来越快速、输出图像越来越精美。播放声音越来越......
本文提出一种单指令流多数据流SIMD微阵列处理机系统.该系统以通用微型计算机为主机,阵列处理机(MAP)作为选件.处理单元阵列(APU)......
随着微处理器的出现,由多至2~(14)到2~(16)个微处理器组成的大型并行处理系统已经有实现的可能。一种多处理机结构——SIMD(单指......
It is relatively clear how to map regular, repetitive or grid oriented computations onto SIMD architectures. It is not s......
英特尔公司的奔腾Ⅲ自2月28日亮相后,不断的掀起狂潮,吸引了IT采购者的关注。但ZD实验室对奔腾Ⅲ进行测试后,却得出了这样的结论:......